SPSS 独立样本 T 检验

作者：Ruben Geert van den Berg，发表于 T 检验

本教程的最新、无广告视频版本已包含在我们的 SPSS 初学者课程 中。

假设
独立样本 T 检验流程图
独立样本 T 检验对话框
输出 I - 显著性水平
输出 II - 效应量
APA 报告 - 表格 & 文本

介绍 & 示例数据

独立样本 T 检验 (Independent Samples T-Test) 检验两个总体在某个定量变量上的均值是否相等。例如，来自离异家庭的儿童与来自非离异家庭的儿童在心理测试上的平均分是否相等？我们将使用 divorced.sav 作为示例，其部分数据如下所示。

首先，我想用下面的语法 (syntax) 缩短一些变量标签。这样做可以防止我的表格太宽，无法适应我最终论文中的页面。

***应用较短的变量标签以避免宽表格。**
variable labels
anxi 'Anxiety'
depr 'Depression'
comp 'Compulsive Behavior'
anti 'Antisocial Behavior'.

现在让我们快速浏览一下数据。一切看起来都合理吗？是否有任何异常值或缺失值？我喜欢通过运行一些来自下面语法的快速直方图来找出答案。

***快速检查分布是否合理。**
frequencies anxi to anti
/format notables
/histogram.

结果

首先，请注意所有频率分布看起来都是合理的：我们没有看到任何奇怪或不寻常的东西。
此外，我们的直方图都没有显示任何关于变量的清晰异常值 (outliers)。
最后，请注意每个变量的 N = 83。由于这是我们的总样本量，这意味着它们都不包含任何缺失值 (missing values)。

经过快速检查后，我喜欢创建一个表格，其中包含所有因变量的样本量、均值和标准差，并按组进行分隔。

最好的方法是从 A nalyze（分析） SPSS 菜单箭头 C ompare Means（比较均值） M eans（均值）中进行，但语法非常简单，直接输入会更快：

***单独组的描述性统计。**
means anxi to anti by divorced
/cells count mean stddev.

结果

请注意，所有因变量的 n = 49（父母未离婚）和 n = 34（父母离婚）。
另请注意，来自离异家庭的儿童在大多数测试中的平均分略高。反社会行为（最后一列）的差异尤其大。

现在，最重要的问题是：我们能否从这些样本差异中得出结论，即整个总体也存在差异？独立样本 T 检验将精确地回答这个问题。但是，它需要一些假设。

假设

独立观察 (independent observations)。如果数据的每一行代表不同的人，则通常成立。
正态性 (Normality)：因变量必须在每个子群体中服从正态分布 (normal distribution)。如果两个 n ≥ 25 左右，则不需要。
方差齐性 (Homogeneity)：两个子群体在因变量上必须具有相等的方差。如果两个样本量大致相等，则不需要。

如果样本量大致不相等，则可以使用 Levene 检验 (Levene’s test) 来检验是否满足齐性。如果不是这种情况，则应报告调整后的结果。这些结果显示在 SPSS T 检验输出中的“未假设方差相等 (equal variances not assumed)”下。

更一般地，此过程称为 Welch 检验 (Welch test)，也适用于 ANOVA，如 SPSS ANOVA - Levene 检验“显著” (SPSS ANOVA - Levene’s Test “Significant”) 中所述。

现在，如果信息量太大，请尝试遵循下面的流程图。

独立样本 T 检验流程图

独立样本 T 检验对话框

首先，让我们导航到 A nalyze（分析） SPSS 菜单箭头 C ompare Means（比较均值） Independen t Samples T Test（独立样本 T 检验），如下所示。

接下来，我们填写对话框，如下所示。

遗憾的是，效应量 (effect sizes) 仅在 SPSS 27 及更高版本中可用。由于它们非常有用，因此如果您仍在 SPSS 26 或更旧版本上，请尝试升级。

无论如何，完成这些步骤将产生以下语法。让我们运行它。

***独立样本 T 检验。**
T-TEST GROUPS=divorced(0 1)
/MISSING=ANALYSIS
/VARIABLES=anxi depr comp anti
/ES DISPLAY(TRUE)
/CRITERIA=CI(.95).

输出 I - 显著性水平

如前所述，每个因变量都有 2 行结果。要报告哪一行取决于 Levene 检验，因为我们的样本量不（大致）相等：

如果 Levene 检验的“Sig”或 p ≥ .05，则报告“假设方差相等 (Equal variances assumed)” T 检验结果。
否则，报告“未假设方差相等 (Equal variances not assumed)” T 检验结果。

按照此程序，我们得出结论，焦虑 (p = .055) 和抑郁 (p = .052) 的平均差异不具有统计显著性 (statistically significant)。

然而，强迫行为 (p = .002) 和反社会行为 (p < .001) 的差异都具有高度“显著性”。

最后一个发现意味着，如果我们的总体具有完全相等的均值，那么我们的样本差异极不可能出现。输出还包括平均差异及其置信区间 (confidence intervals)。

例如，焦虑的平均差异是焦虑测试的 -1.30 分。但我们不知道的是：我们应该认为这是一个小的、中等的还是大的差异？我们将通过将平均差异标准化为效应量指标 (effect size measures) 来回答这个问题。

输出 II - 效应量

T 检验最常见的效应量指标是 Cohen’s D，我们可以在效应量表中的“点估计 (point estimate)”下找到它（仅适用于 SPSS 27 及更高版本）。

一些一般经验法则是：

|d| = 0.20 表示小效应；
|d| = 0.50 表示中等效应；
|d| = 0.80 表示大效应。

因此，我们可以认为焦虑测试的 d = -0.43 大致是离婚的中等效应，依此类推。

APA 报告 - 表格 & 文本

下图显示了用于报告本教程中获得的结果的精确 APA 风格表格。

小提示：如果所有测试都具有相等的自由度 (degrees of freedom, df)，则可以省略此列。在这种情况下，将 df 添加到 t 的列标题，如 t (81)。

此表是通过将 Excel 中 3 个不同 SPSS 输出表中的结果组合在一起而创建的。如果您掌握了一些技巧，这不必花费大量精力。我希望尽快在单独的教程中介绍这些内容。

如果您更喜欢以文本格式报告结果，请遵循以下示例。

请注意，d = -0.43 在这里指的是 Cohen’s D，它是从单独的表格中获得的，如前所述。

最终说明

大多数教科书都会告诉你：

使用独立样本 T 检验来比较 2 个子群体的均值，以及
使用 ANOVA 来比较 3 个或更多子群体的均值。

那么，如果我们在数据中的 2 个组上运行 ANOVA 而不是 T 检验会发生什么？下面的语法就是这样做的。

***与 ANOVA 完全相同的分析。**
ONEWAY anxi depr comp anti BY divorced
/ES=OVERALL
/STATISTICS HOMOGENEITY WELCH
/MISSING ANALYSIS
/CRITERIA=CILEVEL(0.95).

运行此语法的人会很快发现大多数结果是相同的。这是因为独立样本 T 检验是 ANOVA 的一种特殊情况。但是，存在两个重要的差异：

ANOVA 得出一个单一的 p 值，该值与相应 T 检验的 p (2-tailed，双尾) 相同；
ANOVA 的效应量是（偏）eta 平方 (partial eta squared) 而不是 Cohen’s D。

这就提出了一个重要的问题：为什么我们报告不同的指标来比较 2 个而不是 3 个或更多组？我的回答：我们不应该这样做。这意味着我们应该

始终报告 T 检验的 p __ (2-tailed)，永远不要报告 p __ (1-tailed，单尾)；
报告 eta 平方作为 T 检验的效应量，并放弃 Cohen’s D。